Classification et extraction des documents complexes à partir des images issues d'un périphérique mobile : application aux documents d'identité
نویسندگان
چکیده
We propose in this paper a document image classification method. In contrary to most of existing systems, the proposed approach allow locating the document and recognizing its type simultaneously. First, a knowledge base of document models is created from reference images. Training images are not indispensable and though only one reference image is enough to create a document model. Then, key-points are extracted from the request image and matched against the models in the knowledge base. Once the document model is found, a more accurate matching is applied in order to extract the document from the image. The matching process is optimized in order to guarantee an execution time independent from the number of document models. Finally, the document quality is estimated in order to reject unkown documetns. Our system has been evaluated on a set of 2494 real documents MOTS-CLÉS : Classification, Document d’identité, Descripteurs locaux, SURF, Flann, KDTree.
منابع مشابه
Enrichissement sémantique de documents XML représentant des tableaux
Résumé. Ce travail a pour objectif la construction automatique d’un entrepôt thématique de données, à partir de documents de format divers provenant du Web. L’exploitation de cet entrepôt est assurée par un moteur d’interrogation fondé sur une ontologie. Notre attention porte plus précisément sur les tableaux extraits de ces documents et convertis au format XML, aux tags exclusivement syntaxiqu...
متن کاملModèles de langue pour la mise à jour d'un profil d'entité
RÉSUMÉ. Dans cet article nous souhaitons renvoyer à partir de documents issus du Web, ceux apportant des informations nouvelles sur une entité donnée. Ces documents peuvent ainsi servir à mettre à jour un profil existant (par exemple une page Wikipedia) de cette entité. Notre approche se base initialement sur un appariement des mentions de l’entité afin de renvoyer un premier ensemble de docume...
متن کاملAnalyse OLAP d'un entrepôt de documents XML
RESUME. Les systèmes OLAP basés sur des entrepôts de données sont aujourd’hui bien intégrés dans les organisations, ils facilitent le traitement et l’analyse de l’information pour la prise de décision. Le développement du Web a conduit à l’accroissement du volume de données traité, ainsi qu’à la diversification des sources de l’information. Ce problème de diversification a été en partie résolu ...
متن کاملFouille de données complexes et logique floue : extraction de motifs à partir de bases de données multidimensionnelles. (Fuzzy and Complex Data Mining: Knowledge Discovery from Multidimensional Data)
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...
متن کاملNouvelles perspectives en extraction d'information
Les techniques dites d'extraction d'information (EI) ont connu un essor considérable ces dix dernières années. L'EI consiste à extraire de documents des informations précises et à les structurer sous une forme prédéfinie. Il s'agit en général de remplir des formulaires donnant certaines caractéristiques concernant des entités ou des événements évoqués dans les textes ainsi que des relations ent...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2016